# 《AI 新范式》第8节：Ollama 模型部署与验证

作者：小傅哥
博客：https://bugstack.cn (opens new window)
视频：https://t.zsxq.com/UKozV (opens new window)

沉淀、分享、成长，让自己和他人都能有所收获！😄

Docker 部署 Ollama · 加载大模型 · API 调用验证，让你的云服务器拥有 AI 能力。

# 一、本章诉求

在云服务器上通过 Docker 部署 Ollama，加载 qwen2.5 等大模型，完成 API 接口调用验证，让云服务器拥有 AI 能力。

# 二、Ollama Docker 部署

# 1. 容器化部署

Docker 一键启动 Ollama，挂载模型目录，GPU 直通支持。

# 2. 模型下载

ollama pull 加载模型，支持 qwen2.5、llama3、deepseek 等。

# 3. 外网访问

配置 OLLAMA_HOST=0.0.0.0 开放外网 API 调用。

# 三、Docker 部署

docker run -d \
  --name ollama \
  -p 11434:11434 \
  -e OLLAMA_HOST=0.0.0.0 \
  -v ollama_models:/root/.ollama \
  ollama/ollama

# 进入容器拉取模型
docker exec -it ollama bash
ollama pull qwen2.5:7b

1
2
3
4
5
6
7
8
9
10

# 四、常用模型命令

# 拉取模型
ollama pull qwen2.5:7b
ollama pull deepseek-r1:8b

# 查看已安装模型
ollama list

# 本地对话测试
ollama run qwen2.5:7b
> 你好，介绍一下你自己

1
2
3
4
5
6
7
8
9
10

# 五、API 接口验证

整体调用链路如下：

💻 调用方（SpringBoot / curl）
        ↓ HTTP 请求
🤖 Ollama API（localhost:11434）
        ↓ 模型推理
✅ 返回结果（JSON / Stream）

1
2
3
4
5

# 1. curl 接口验证

# 查看已安装模型
curl http://IP:11434/api/tags

# 调用模型（同步）
curl http://IP:11434/api/generate \
  -d '{"model":"qwen2.5:7b",
    "prompt":"你好"}'

# 调用模型（兼容 OpenAI）
curl http://IP:11434/v1/chat/completions \
  -d '{"model":"qwen2.5:7b",
    "messages":[{"role":"user",
    "content":"你好"}]}'

1
2
3
4
5
6
7
8
9
10
11
12
13

# 2. SpringBoot 集成

## application.yml
spring:
  ai:
    ollama:
      base-url: http://IP:11434
      chat:
        model: qwen2.5:7b

1
2
3
4
5
6
7

// Java 调用
@Autowired
ChatClient chatClient;
String result = chatClient
  .prompt("你好")
  .call()
  .content();

1
2
3
4
5
6
7

# 六、读者作业

简单作业：Docker 部署 Ollama 并拉取 qwen2.5:7b 模型，使用 curl 调用 API 验证模型返回正常。
复杂作业：思考 Ollama 的 OpenAI 兼容接口和原生接口的区别？为什么兼容 OpenAI 协议对生态很重要？

← 第7节：压测项目分析性能第9节：智能对话客服集成 →

常用搜索	百度 Google Bing Github 搜代码
技术社区	CDSN 博客园 OSChina 思否掘金 Linux公社 IBM 开发者 StackOverflow
PDF 下载	《Java 面经手册》《重学Java设计模式》《手撸 Spring》《字节码编程》
面试求职	简历优化简历筛选大厂要求薪资待遇北漂生活
Java相关	数据结构和算法并发和锁多线程 Java8 特性 JVM 虚拟机
Spring	手写 Spring SpringCloud 入门 Mybatis 源码分析手写 Mybatis Quartz 源码分析
面向对象	设计模式 DDD 落地低代码字节码插桩画架构图系统监控中台研发规范
中间件&插件	Maven中央仓库数据库路由设计 IDEA-Plugin
Netty 4.x	基础入门中级拓展高级应用 RPC 实现 IM 仿微信
字节码编程	ASM Javassist Byte-Buddy JavaAgent ASM-DOC JVM 指令码
专栏小册	《Netty+JavaFx实战：仿桌面版微信聊天》《SpringBoot 中间件设计和开发》《Lottery 抽奖系统 - 基于领域驱动设计的四层架构实践》
知识星球	码农会锁实战项目